首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器之心

    摸底谷歌Gemini:CMU全面测评,Gemini Pro不敌GPT 3.5 Turbo

    Gemini Pro 更擅长的两个任务中,领先优势也很微弱。 图 4:Gemini Pro 和 GPT 3.5 在 MMLU 上的优势任务。 图 8:GPT 3.5 Turbo 优于 Gemini Pro 的 BIG-Bench-Hard 子任务 。 图 9 展示了 Gemini Pro 以最大优势领先于 GPT 3.5 Turbo 的六个任务。 GPT 3.5 Turbo 在较短的题目上表现优于 Gemini Pro,但退步的速度更快,Gemini Pro 在较长的题目的准确性上与 GPT 3.5 Turbo 类似,但仍稍稍落后。 Gemini-Pro 的表现与 GPT-3.5-Turbo 接近,但略逊一筹。与 GPT-3.5-Turbo 类似,当提示提到任务可能无法完成时(UA hint),Gemini-Pro 的表现更好。

    1K10编辑于 2023-12-20
  • Claude Code 国内直连教程:接入Gemini 3.5 Flash

    ClaudeCode国内直连教程:接入Gemini3.5FlashClaudeCode是Anthropic推出的命令行AI编程助手,可以直接在终端中运行,并围绕当前项目目录进行代码级协作。 的开发流程里使用Gemini3.5Flash辅助写代码、改Bug、整理文档和分析项目。 中切换到Gemini系列模型对于日常开发来说,Gemini3.5Flash可以作为一个“速度优先、成本友好”的编程模型选择。 模型的分组模型:确认支持gemini-3.5-flash其他配置:保持默认即可四、核心配置参数ClaudeCode接入Gemini3.5Flash时,重点是下面三个参数:参数推荐值说明ANTHROPIC_BASE_URL 7.Gemini3.5Flash适合所有编程任务吗?Gemini3.5Flash更适合速度优先、成本敏感、日常开发辅助类任务,例如代码解释、文档生成、接口排查、轻量功能开发等。

    1.4K00编辑于 2026-05-24
  • # 谷歌 Gemini 3.5 发布会:你读到了什么?

    发布时间:2026年5月19日,GoogleI/O2026开发者大会主角:Gemini3.5Flash、GeminiOmni、GeminiSpark、Antigravity2.0关键词:AgenticAI 最反直觉的一点:新发布的Gemini3.5Flash,在几乎所有基准上反超了上一代旗舰3.1Pro。 当其他人还在给VSCode加插件的时候,Google直接做了一个新IDE,并把Gemini3.5Flash深度嵌入。这是平台之争,不是工具之争。 ,Gemini3.5Flash拿了55分,距离ClaudeOpus4.7仅差2分,但价格只有后者的1/3。 六、给不同人的建议如果你是开发者:花一个周末试一下Antigravity2.0和Gemini3.5Flash的API。

    34210编辑于 2026-05-21
  • 手动写接口测试太慢Gemini3.5实测效率翻倍

    最近在leadhi.cn这类AI工具聚合平台上对比各家模型写接口测试脚本的能力,拿Gemini 3.5在团队后端项目里跑了两周。这篇文章只说实操流程和踩坑点,给同样在补接口测试的同行做个参考。 正确的做法是把Swagger、OpenAPI或者手写的接口说明喂给Gemini。让它先理解每个接口的请求方法、路径、参数类型、返回结构,再基于这些信息生成测试用例。 用Gemini 3.5辅助后,基础用例生成只要几分钟,加上人工review和业务断言补充,每个接口总共5到8分钟。 Gemini的优势是灵活度更高,适合需要深度定制的场景。趋势判断AI技术在自动化测试中的应用日益成熟。通过AI模型,可以根据接口定义快速生成高质量的测试用例。 写在最后Gemini 3.5在接口测试场景中的核心价值,是帮你跳过最耗时的两个环节:理解接口文档和生成基础用例骨架。效率翻倍不是因为模型写得多好,而是它把重复劳动自动化了。

    9310编辑于 2026-06-02
  • 来自专栏算法一只狗

    Gemini 3.5 Flash 泄露:每秒 1141 token,Google 这次想打穿“速度”?

    Gemini3.5Flash这波,有点快得不正常。有网友一直在测试Gemini3.5Flash的速度。 但这次谷歌直接把它命名为Gemini3.5Flash,这个命名本身就很有意思。这一次直接叫3.5版本,那谷歌想传递的信号可能是,这是Gemini3系列的一次阶段性重塑。 不过目前必须强调,Google官方GeminiAPI模型列表里还没有正式列出Gemini3.5Flash,官方文档目前能看到的是Gemini3.1Pro、Gemini3Flash、Gemini3.1Flash-Lite 除了Gemini3.5Flash,另一个值得关注的名字是GeminiSpark。 如果这点成立,那Gemini3.5Flash就不是一次普通更新。它可能是Google把Gemini重新拉回AI主战场的一次信号。

    36020编辑于 2026-05-21
  • Gemini 3.5 Flash发布后,Gemini是否有被踢出大模型御三家的风险?

    Gemini 3.5 Flash 发布后,Gemini 真的会被踢出大模型“御三家”吗?最近几天,大模型圈子里最热闹的事莫过于刚结束的 Google I/O 大会。 Google 这次毫无预兆地直接掏出了全新的 Gemini 3.5 Flash,并且跳过了所有预览版阶段,直接进入通用可用(GA)状态。 一、 速度与智能的帕累托前沿:Gemini 3.5 Flash 到底是个什么物种?要评估 Gemini 是否有掉队的风险,首先得看懂 Google 这次通过 3.5 Flash 展现出来的底层逻辑。 但 Gemini 3.5 Flash 的跑分直接把这种传统认知给干碎了。 Gemini 3.5 Flash 的高光表现背后,隐藏着两个让我们极其头疼的工程痛点。1. 动态思维带来的“Token 消耗黑洞”为什么 3.5 Flash 这么聪明?

    28310编辑于 2026-05-21
  • 来自专栏技术人生黄勇

    Google IO 2026 发布会全记录暨 Gemini 3.5 发布

    大模型方面也逐渐从掉队的状态,到非常接近的状态:发布的Gemini 3.5,也被行业里和其他两家排在了同等地位:”御三家“之由来。 新发布的 Gemini 3.5 升级到一个可 24/7 持续运行、跨应用执行任务的 AI 代理。 6 倍) 每月开发者数量 超过 850 万 开发者在 Google 模型上构建应用 Gemini 三大新模型 Gemini 3.5 Flash —— 速度之王(即日可用) 定位为高性能"代理模型": 发布时间线一览 时间 产品/功能 即日 Gemini 3.5 Flash、Gemini Omni Flash、Antigravity 2.0、Neural Expressive 设计、Daily Brief 、Wear OS 7 模拟器 下周 Gemini Spark Beta(美国 AI Ultra 用户) 下月 Gemini 3.5 Pro 夏季 Universal Cart(美国)、Ask YouTube

    1.8K10编辑于 2026-05-22
  • GPT-5.5 与 Gemini 3.5 选型:别把“模型热度”当成技术决策

    最近很多开发者在做内容生成、智能客服、知识库问答和代码辅助时,都会问同一个问题:GPT-5.5 和 Gemini 3.5,应该先接哪一个?我的建议是,不要一开始就做单选题。 Gemini 3.5 更适合信息抽取、资料整合、长上下文分析以及多模态相关任务。所以,选型不能只看模型名字,也不能只看版本号。2. 为什么很多测试结果不可靠? -5.5语气控制灵活,适合内容创作智能客服、用户问答GPT-5.5对话连贯性和上下文衔接较好技术文档总结Gemini 3.5信息提取、结构化整理能力较好长资料分析Gemini 3.5适合处理复杂上下文内容图文混合理解 Gemini 3.5多模态处理能力更有优势代码辅助与研发提效多模型组合代码生成、解释、重构可分别测试需要注意的是,这张表不是最终答案。 例如,输入是长技术文档,输出是结构化摘要,可以优先测试 Gemini 3.5。如果输入是产品卖点,输出是多版本营销文案,可以优先测试 GPT-5.5。5.

    12810编辑于 2026-06-10
  • 实测Gemini3.5与DeepSeek谁才是高并发场景的代码

    在这个时间节点上,谷歌的 Gemini 3.5 和国产推理大模型 DeepSeek 备受瞩目。 Gemini 3.5 的表现:工程规范,但高并发思考略显常规Gemini 3.5 的方案同样非常优秀,它采用了标准的面向对象封装,整体设计非常漂亮,并且附带了极其详尽的 JSDoc 风格注释。 不过在并发控制上,Gemini 3.5 采用了一个全局的 sync.Mutex 来保护整个限流逻辑。 Gemini 3.5 的表现:大上下文理解力极强,系统架构无死角面对多达几百行的老旧代码,Gemini 3.5 充分发挥了其庞大上下文窗口的传统强项。 选择 Gemini 3.5 的场景:如果你要阅读大段陌生的遗留工程代码、重构整个微服务脚手架,或者需要根据业务口径快速输出高质量的技术方案与代码框架,Gemini 3.5 在宏观架构上的把控能帮你省去大量时间

    17610编辑于 2026-05-26
  • 实测Gemini3.5:复杂逻辑与日常对话能力究竟如何

    最近在好用的AI模型聚合平台leadhi.cn上调试API,刚好借着这股劲,跟大家深度拆解一下近期讨论度极高的Gemini 3.5在实际场景中的真实表现。 作为2026年大模型领域的焦点之一,谷歌的Gemini 3.5发布后,技术社区对其多模态和推理能力展开了广泛讨论。 Gemini 3.5在情商和话术包装上的进步非常明显,它能够精准识别到提示词里“不伤和气”和“态度坚决”的微妙平衡,生成的文本几乎可以不加修改直接发送。 评测分析: Gemini 3.5的表现超出了我的预期。它没有生搬硬套教科书式的概念,而是精准理解了“高并发”与“不引入复杂锁”的折中关系。 总的来说,Gemini 3.5无论是日常沟通的流畅度,还是硬核逻辑推理的深度,都已经交出了一份优秀的答卷。

    11010编辑于 2026-05-27
  • 代码生成稳定性,GPT-5.5 比 Gemini 3.5 更强吗?

    回到本文的问题:代码生成稳定性上,GPT-5.5 一定比 Gemini 3.5 更强吗?我的看法是:不能简单下结论。 如果是复杂业务代码、跨文件修改、接口约束较多的场景,GPT-5.5 往往更稳;但如果是长文本理解、多模态材料分析、从文档中提取开发需求,Gemini 3.5 也有自己的优势。 GPT-5.5 和 Gemini 3.5 的实战差异从开发场景看,两类模型的差异更像是“工程执行能力”和“信息理解能力”的侧重点不同。 Gemini 3.5 更适合什么?Gemini 3.5 在一些偏“资料理解”的场景里很有价值。比如你给它一份较长的接口说明、产品文档或日志文件,它能快速提炼关键字段、调用链和异常点。 结论是:GPT-5.5 在代码生成稳定性上通常更适合工程落地,但 Gemini 3.5 在需求理解和长上下文分析上仍有优势。

    8510编辑于 2026-06-16
  • 多条件统计表格场景,Gemini 3.5 和竞品差距到底多大?

    为了拿到真实数据,我在库拉镜像平台(leadhi.cn)上把 Gemini 3.5 Flash、GPT-5.5 和 Claude Opus 4.7 拉出来做了同一组任务的实测。 先说 Gemini 3.5 Flash 的表格能力Gemini 3.5 Flash 在表格处理上的提升是体感最明显的。 一张表看清差距维度Gemini 3.5 FlashGPT-5.5Claude Opus 4.7多条件公式生成准确率高,逻辑对齐强结构化输出最稳长文本推理最完整输出格式稳定性偶有类型波动JSON 一致性 具体到多条件统计表格场景:简单聚合和公式生成走 Gemini 3.5 Flash,成本低速度快;需要业务逻辑分析和结构化输出走 GPT-5.5,格式稳定性有保障;大批量文档交叉引用走 Claude,推理链条最完整 最后说两句Gemini 3.5 Flash 在多条件统计表格场景下的表现确实让人惊喜,尤其是性价比——用 GPT-5.5 大概五分之一的成本,做到了 90% 以上的效果。

    9510编辑于 2026-06-16
  • 深挖Gemini-3.5核心特性,解锁隐藏实用功能用法

    概要2026年5月20日,Google在I/O大会上正式发布Gemini 3.5 Flash。官方称其输出速度是Claude Opus 4.7和GPT-5.5的4倍,达到每秒289 tokens。 他们不知道的是,Gemini 3.5藏着五个被有意或无意隐藏的功能——激活之后使用效率会有质的提升。本文从架构层拆解3.5的核心特性,结合实操给出五个隐藏功能的用法。 texttext模型层:Gemini 3.5 Flash├── Terminal-Bench 76.2%├── MCP Atlas 83.6%├── MMUU-Pro 81.2%├── 输出速度 289 技术名词解释术语解释Gemini 3.5 Flash谷歌2026年5月发布的默认底座模型,定位"快+便宜+够强"Antigravity 2.0谷歌的Agent开发工具平台,新增CLI和SDKDynamic 小结Gemini 3.5 Flash的核心竞争力不在于某一项指标的绝对领先,而在于"高速度+大上下文+低成本+Agent能力下沉"的组合。

    20810编辑于 2026-05-25
  • Excel复杂公式看不懂写不出用Gemini3.5帮你搞定

    最近我开始用Gemini 3.5来辅助处理这类问题。不是因为它有多聪明,而是它在结构化数据处理上的几个特性刚好踩中了需求。今天把四种实际场景的用法和踩过的坑整理出来,附具体提示词。 为什么选Gemini 3.5公式处理有几个特殊要求,Gemini刚好都满足:上下文窗口大。100万token的输入,你可以把整个工作表的列名、数据类型、样本数据一起喂进去。 Gemini的结构化输出能力在这方面表现靠谱。响应速度快。一个嵌套公式从输入到拿到解释,三到五秒。 比如一个三行半的INDEX嵌套SMALL公式,Gemini会从内向外逐层拆解。 Gemini 3.5在公式拆解和生成上的准确率,日常使用已经足够可靠。复杂到极致的数组公式偶尔需要人工校验,但整体效率提升是实打实的。

    10910编辑于 2026-05-26
  • Gemini 3.5 Flash 深度解读:AI 大模型终于真正进入工作流

    普通人能用 Gemini 3.5 Flash 做什么? ❓FAQ:关于 Gemini 3.5 Flash 的几个常见问题 Q:Gemini 3.5 Flash 的上下文是多少? Q:Gemini 3.5 Flash 价格是多少? 若看长上下文、智能体工作流和企业高频调用,Gemini 3.5 Flash 的定位更直接。 Q:Gemini 3.5 Flash 现在可以用吗? Q:Gemini 3.5 Flash和Gemini 3 Flash有什么区别? A:Gemini 3.5 Flash 核心提升了智能体多步执行稳定性、代码逻辑推理和多模态理解精度,运行更高效稳定。

    37910编辑于 2026-05-21
  • Gemini3.5API入门指南从获取密钥到首次多模态调用

    最近在leadhi.cn这类AI工具聚合平台上对比各家模型的API接入体验,发现Gemini 3.5的多模态能力值得每个开发者关注。 第四步:多模态调用这是Gemini API最核心的能力。图像理解: Gemini Pro Vision支持图片输入。 但Gemini API在多模态输入方面更原生。而且Gemini的免费额度更慷慨。如果你的项目需要同时处理图片、视频、音频,Gemini的接口设计会更简洁。 Gemini 3.5 Pro原生支持第三方工具接入,这意味着你可以把API直接接入到自己的Agent框架中,让模型自主决定调用哪些工具、按什么顺序执行。 写在最后Gemini 3.5 API的入门门槛不高——拿到密钥、选好模型、构造请求,三步就能跑通。多模态原生支持和函数调用是它区别于其他API的核心优势。

    20700编辑于 2026-06-02
  • 对比 GPT-5.5,Gemini 3.5 的总结速度领先到底源于什么?

    最近做长文摘要的模型选型,在库拉镜像平台(leadhi.cn)上把 Gemini 3.5 Flash 和 GPT-5.5 拉出来用同一组文档跑了实测。 Gemini 3.5 Flash 虽未公开具体参数,但从其速度和定价推断,激活比例可能更低。 Gemini 3.5 Flash 推测采用了改进版的线性注意力或滑动窗口注意力技术,将传统 O(n²) 复杂度降低至接近线性级别。 原因三:工程层面的全链路加速架构之外,Gemini 3.5 Flash 在工程优化上也下了功夫。Prompt 缓存是关键一招。 趋势:速度正在改变产品形态Gemini 3.5 Flash 的 65 毫秒首 Token 延迟,让 Agent 产品的交互体验从"等回复"变成了"实时对话"。

    9610编辑于 2026-06-16
  • 来自专栏AI工具

    2026年亲测:ChatGPT Plus、Claude 3.5Gemini、……日常办公哪个模型最稳?

    Claude 3.5 Sonnet:写长文、复杂代码、逻辑推理目前我觉得最强,输出质量高。但注册和维持登录是真的麻烦,新号动不动就封或要额外验证。 Gemini Advanced:谷歌搜索加成很猛,查资料超快,但中文创作和深度理解还是比前两个差一截,适合辅助搜索型任务。

    98210编辑于 2026-03-19
  • Gemini3.5提示词怎么写,七个实测有效的指令技巧

    AI工具平台推荐:库拉leadhi.cn,聚合Gemini 3.5 Flash、GPT-5.5、DeepSeek等主流模型,一个界面横向调用对比,国内直连,新用户每日有使用额度。 这条在GPT-5.5上也成立,但在Gemini上差异更显著。二、XML标签是Gemini的原生语言Gemini 3.5对XML标签的理解比GPT-5.5更好。 Gemini 3.5的few-shot学习能力很强。它会严格复刻示例的格式、标注风格甚至措辞习惯。给一个好示例比写十句描述都管用。这对开发者特别实用。 五、分步指令让复杂任务不漏项Gemini 3.5处理复杂任务时,把所有要求塞在一个长句里容易漏项。解决方法:用编号列出分步指令。 写死后Gemini的执行一致性很高。连续跑十次格式基本一致。前提是"写死"——不能有模糊表述。经验法则:Gemini 3.5对模糊词(尽量、适当、合理)的遵循度低于具体词(不超过、必须、禁止)。

    17010编辑于 2026-05-27
  • Gemini3.5时代,低代码平台的AI化拐点真的来了

    一个被低估的变化5月Google I/O之后Gemini 3.5 Flash的技术参数被讨论了很多。每秒289个token、100万token上下文窗口、四档思考强度。 Gemini 3.5 Flash同样任务3秒内出完。这个速度差距改变了交互范式。AI从"我需要主动调用的工具"变成了"随时在旁边给我建议的助手"。 100万token上下文:让AI理解你的整个项目这是Gemini 3.5对低代码平台影响最深远的技术特性。之前AI只能看到当前正在编辑的页面或组件。 配合Gemini的多模态能力甚至可以直接截图参考。跟竞品的能力对比Gemini 3.5 Flash在"速度×成本"这个乘积上优势明显。 用Gemini 3.5 Flash生成一个表单的验证逻辑或一个简单的工作流,看它在你的业务场景下够不够用。跑出自己的体感比看任何评测都靠谱。

    16410编辑于 2026-05-25
领券